DAY5-資料分析的工具:pandas(Series)

15th鐵人賽

cc0303

2023-09-20 16:14:38

766 瀏覽

分享至

前言

學過了numpy之後，接下來看看pandas的用法吧。在pandas中，提供了一些讀取不同檔案的方法。

讀取檔案的方法

import pandas as pd      #載入pandas套件，縮寫為pd

pd.read_cvs('a.csv')     #讀取csv檔
pd.read_json('a.json')   #讀取json檔
pd.read_html('url')      #讀取網頁
pd.read_excel('a.xlsx')  #讀取xlsx檔

Series:建立索引的一為串列，通常用來處理時間序列相關的資料。

以下介紹一些有關series的用法

>>> import pandas as pd
>>> a = pd.Series([1,2,3])
>>> print(a)
0    1
1    2
2    3
dtype: int64

利用values顯示series中的元素

>>> a.values  
array([1, 2, 3])

利用index顯示series中的元素

>>> a.index                         
RangeIndex(start=0, stop=3, step=1) #Series是從0開始到4結束，每個資料間隔為1

利用索引顯示元素

>>> a[1] 
2

透過Series將TP字典的Key轉為index序列

>>> TP={"100":"中正區","103":"大同區","104":"中山區","105":"松山區","106":"大安區","108":"萬華區","110":"信義區","111":"士林區","112":"北投區","114":"內湖區","115":"南港區","116":"文山區"}
>>> pd.Series(TP)
100    中正區
103    大同區
104    中山區
105    松山區
106    大安區
108    萬華區
110    信義區
111    士林區
112    北投區
114    內湖區
115    南港區
116    文山區
dtype: object

今天學完pandas中Series的用法，明天再繼續學pandas中的DataFrame吧!

---20230920---